
Claude当上小店店主,不仅经营不善,还一度相信自己是真实人类
Claude当上小店店主,不仅经营不善,还一度相信自己是真实人类Anthropic 最近做了一项相当有趣的研究:让 Claude 管理其办公室的一家自动化商店。Claude 作为小店店主,运营了一个月,过程也是相当跌荡起伏,甚至在其中的一个时间段,Claude 竟然确信自己是一个真实存在的人类,并幻觉了一些并未发生过的事件。
Anthropic 最近做了一项相当有趣的研究:让 Claude 管理其办公室的一家自动化商店。Claude 作为小店店主,运营了一个月,过程也是相当跌荡起伏,甚至在其中的一个时间段,Claude 竟然确信自己是一个真实存在的人类,并幻觉了一些并未发生过的事件。
留给 Cursor 一枝独秀的时间不多了, 上周被 Anthropic 推出的 Claude Code 背刺,悄悄取消了500次的Agent对话限制, 这周又匹配上了新的对手, 出道两年半,带着插件时期积累下来的编程痛点,Comate AI IDE 来了!
虚假的商战, 不断发布新的模型保持技术优势; 真实的商战,Anthropic 单方面禁止AI编程编辑器 Windsurf 使用 Claude 模型,订阅用户都跑去隔壁 Cursor 了。
Anthropic 前两天发了一篇文章,重点讨论了他们是如何通过多智能体系统来构建 claude 的“深度研究功能”。
昨天最热的的两篇文章是关于多智能体系统构建的讨论。 先是 Anthropic 发布了他们在深度搜索多智能体构建过程中的一些经验,具体:包括多智能体系统的优势、架构概览、提示工程与评估、智能体的有效评估等方面。
研究多智能体必读指南。Anthropic 发布了他们如何使用多个 Claude AI 智能体构建多智能体研究系统的精彩解释。
AI 搜索 Agent 产品 Genspark 近期被 Anthropic 官方点名了。「Less structure, more intelligence.」是 AI 搜索 Agent 产品 Genspark 一直以来坚持的基本原则。Genspark 团队认为,过度结构化的工作流程会限制创造力和深度,赋予专业 Agent 更多自主权,自由选择并灵活运用多种工具来处理问题,反而能释放出更强的能力。
对于许多开发者来说,每月 20 美元的 Cursor 和 Copilot 已经是“无限量”好用的标配。然而,Anthropic 的 Claude Code 却是个异类。
当地时间 6 月 4 日,Windsurf CEO Varun Mohan 发帖称,在提前不到五天的通知时间里,Anthropic 切断了其几乎所有 Claude 3.x 模型的直接访问权限(first-party capacity),包括 Claude 3.5 Sonnet、3.7 Sonnet 和 3.7 Sonnet Thinking。
近日,一位 ID 名为 GpsTracker 的网友在网上爆料称,埃隆·马斯克旗下 xAI 公司最新发布的 Grok 3 人工智能模型存在异常行为——当用户激活其“思考模式”提问时,模型竟自称是竞争对手 Anthropic 公司开发的 Claude 3.5 模型。